其他
资源|100+开源干货助你成为Python专家(自然语言 ①)
来源:Github 编辑: 王健
Natural Language Processing
NLTK - 用于构建Python程序以处理人类语言数据的领先平台。
http://www.nltk.org/
模式 - 用于Python编程语言的Web挖掘模块。它具有自然语言处理,机器学习等工具。
www.clips.ua.ac.be/pattern
Quepy - 一个python框架,用于将自然语言问题转换为数据库查询语言中的查询
https://github.com/machinalis/quepy
TextBlob - 提供一致的API,用于潜入到常见的自然语言处理(NLP)任务。站在NLTK和模式的巨型肩膀上,并与两者发挥得很好。
textblob.readthedocs.io/en/dev/
YAlign - 一个句子对齐器,一个友好的工具,用于从可比语料库提取并行句子。
https://github.com/machinalis/yalign
jieba - 中文字分割工具。
https://github.com/fxsjy/jieba#jieba-1
SnowNLP - 用于处理中文文本的库。
https://github.com/isnowfy/snownlp
spammy - 用于电子邮件垃圾邮件过滤的库,构建于nltk之上
https://github.com/prodicus/spammy
loso - 另一个中文分段库。
https://github.com/victorlin/loso
genius- 条件随机场的中文分段基础。
https://github.com/duanhongyi/genius